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1 



tttagagccgggtaggggag tgccttctgggctttttcta 5095 

Scoring table: IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 

Searched: 7568541 seqs, 34560148153 residues 

Total number of hits satisfying chosen parameters: 



15137082 



Minimum DB seq length: 0 
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Post-processing: Minimum Match 0% 
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Listing first 45 summaries 



Database : GenEmbl:* 



1 




gb env:* 


2 




gb_pat : * 


3 




gb_ph : * 


4 




gb_pl : * 


5 




gb_pr : * 


6 




gb_ro : * 


7 




gb_sts : * 


8 




gb sy:* 


9 




gb un : * 


10: 


gb_vi : * 


11: 


gb_ov : * 


12: 


gb_htg : 


13: 


gb_in : * 



AC016814 Mus muscu 

39 439 8.6 

AK22544 6 Homo sapi 

c 40 424.4 8.3 
AC096239 Rattus no 

41 424.4 8.3 
AC113625 Rattus no 

42 424.4 8.3 
AC123384 Homo sapi 

43 422.2 8.3 
AY4 63358 Homo sapi 

c 44 411 8.1 

AX381439 Sequence 

45 375.8 7.4 
AR266587 Sequence 



1528 5 AK225446 

258646 12 AC096239 

269847 12 AC113625 

331730 12 AC123384 

738 5 AY463358 

438 2 AX381439 

463 2 • AR266587 



ALIGNMENTS 



RESULT 1 
AF110184 

LOCUS AF110184 10772 bp DNA linear 

PRI 22-JUL-1999 

DEFINITION Homo sapiens epithelium-restricted Ets protein ESX 
gene, complete 

cds. 

ACCESSION AF110184 

VERSION AF110184.1 GI: 5565858 

KEYWORDS 

SOURCE Homo sapiens (human) 

ORGANISM Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; 
Euteleostomi; 

Mammalia; Eutheria; Euarchontoglires; Primates; 

Haplorrhini; 

Catarrhini; Hominidae; Homo. 
REFERENCE 1 (bases 4802 to 9870) 

AUTHORS Chang, C.H., Scott, G.K., Kuo,W.L., Xiong,X., 
Suzdaltseva, Y. , 

Park, J. W. , Sayre,P., Erny,K., Collins, C, Gray, J. W. 
and Benz,C.C. 

TITLE ESX: a structurally unique Ets overexpressed early 
during human 

breast tumorigenesis 
JOURNAL Oncogene 14 (13), 1617-1622 (1997) 



PUBMED 9129154 
REFERENCE 2 (bases 1 to 10772) 

AUTHORS Chang, C.H., Scott, G.K., Baldwin, M. A. and Benz,C.C. 
TITLE Exon 4-encoded acidic domain in the 
epithelium-restricted Ets 

factor, ESX, confers potent transactivating capacity 

and binds to 

TATA-binding protein (TBP) 
Oncogene 18 (25), 3682-3695 (1999) 
10391676 

3 (bases 1 to 10772) 
Chang, C.H., Scott, G.K. and Benz,C.C. 
Direct Submission 

Submitted (30-NOV-1998) Hematology/Oncology, U.C.S.F. 



JOURNAL 
PUBMED 

REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

505 



FEATURES 

source 



misc_feature 
repeat_region 

repeat region 



CAAT_signal 
additional 

TATA_signal 
additional 



Parnassus Ave., San Francisco, CA 94143-1270, USA 
Location/Qualifiers 
1. .10772 

/organism="Homo sapiens" 
/mol_type="genomic DNA" 
/db_xref="taxon: 9606" 
/chromosome=" 1 " 
/map="lq32" 
34. .622 

/note="similar to THC 213038" 
921. .1524 
/rpt_family="Alu" 
/rpt_type=dispersed 
2978. .3293 
/rpt_family="Alu" 
/rpt_type=dispersed 
4697. .4702 

/inf erence="non-experimental evidence, no 



mRNA 
.6360, 6526. 

.8206, 9076. 

ESX" 

5'UTR 



6618, 
9872) 



details recorded" 
4735. .4736 

/inference="non-experimental evidence, no 
details recorded" 

join(4777. .4888,5311. .5481,6139. 
6822. .6941,7129. .7218,7364. .7480,8011. 
/product="epithelium-restricted Ets protein 
join(4777. .4888,5311. .5318) 



exon 

misc_f eature 

exon 

CDS 

.6618,6822. .6941, 

.9190) 

Homo 



Accession 



ESX" 



4777. .4888 
/number=l 
4785. .4901 

/note="putative CpG island" 

5311. .5481 

/number=2 

join(5319. .5481,6139. .6360,6526. 

7129. .7218,7364. .7480,8011. .8206,9076. 

/note="epithelial-restricted with serine box; 

sapiencs ESX cDNA ORF presented in GenBank 

Number U668 94" 
/codon_start=l 

/product="epithelium-restricted Ets protein 

/protein_id="AAD4 5237. 1" 
/db xref="GI: 5565859" 



/translation="MAATCEISNIFSNYFSAMYSSEDSTLASVPPAATFGADDLVLTL 
SNPQMSLEGTEKASWLGEQPQFWSKTQVLDWISYQVEKNKYDASAIDFSRCDMDGATL 



CNCALEELRLVFGPLGDQLHAQLRDLTSSSSDELSWIIELLEKDGMAFQEALDPGPFD 



QGSPFAQELLDDGQQASPYHPGSCGAGAPSPGSSDVSTAGTGASRSSHSSDSGGSDVD 



LDPTDGKLFPSDGFRDCKKGDPKHGKRKRGRPRKLSKEYWDCLEGKKSKHAPRGTHLW 



EFIRDILIHPELNEGLMKWENRHEGVFKFLRSEAVAQLWGQKKKNSNMTYEKLSRAMR 

YYYKREILERVDGRRLVYKFGKNSSGWKEEEVLQSRN" 
repeat_region 5773. .6059 

/rpt_family="Alu" 

/rpt_type=dispersed 
exon 6139. .6360 

/number=3 
exon 6526. .6618 

/number=4 
exon 6822. .6941 

/number=5 
exon 7129. .7218 

/number=6 
exon 7364. .7480 

/number=7 



misc feature 



exon 



repeat_region 



exon 
3'UTR 

polyA_signal 



additional 



misc feature 



misc feature 



7401. .7525 

/note="putative CpG island" 

8011. .8206 

/number=8 

8655. .8775 

/rpt_family="Alu" 

/rpt_type=dispersed 

9076. .9872 

/number=9 

9191. .9872 

9845. .9850 

/inf erence="non-experimental evidence, no 

details recorded" 
complement (9952. .10387) 
/note="similar to THC 209689" 
10358. .10772 

/note="similar to THC 203540" 



ORIGIN 



Query Match 100.0%; Score 5095; DB 5; Length 

10772; 

Best Local Similarity 100.0%; Pred. No. 0; 
Matches 5095; Conservative 0; Mismatches 0; Indels 
0; Gaps 0; 

Qy 1 

TTTAGAGCCGGGTAGGGGAGCGCAGCGGCCAGATACCTCAGCGCTACCTGGCGGAACTGG 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 4777 

TTTAGAGCCGGGTAGGGGAGCGCAGCGGCCAGATACCTCAGCGCTACCTGGCGGAACTGG 4 836 

Qy 61 

ATTTCTCTCCCGCCTGCCGGCCTGCCTGCCACAGCCGGACTCCGCCACTCCGGTAGGATT 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4837 

ATTTCTCTCCCGCCTGCCGGCCTGCCTGCCACAGCCGGACTCCGCCACTCCGGTAGGATT 4 896 
Qy 121 

CCCCGCCTGTCATTCCCTAGCCCAGCTCTTGGGAAACTGCAGAGGGGTCCAGAGGATTTG 180 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4897 

CCCCGCCTGTCATTCCCTAGCCCAGCTCTTGGGAAACTGCAGAGGGGTCCAGAGGATTTG 4 956 



Qy 181 

CAGTTCTGAACCTGCACACTCCAGTCTAGGATCTCCGAGCAAGAGCGTAGGTGTCCTGAG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I . 
Db 4957 

CAGTTCTGAACCTGCACACTCCAGTCTAGGATCTCCGAGCAAGAGCGTAGGTGTCCTGAG 5016 
Qy 241 

GGTCAAAGAACAGAGAGAGATTGTCTCTGGGAAGGCAGAATGGCCATGACGCCGCTAGTC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I |.| I I I I I I I I I I I I I I I I I 
Db 5017 

GGTCAAAGAACAGAGAGAGATTGTCTCTGGGAAGGCAGAATGGCCATGACGCCGCTAGTC 5076 
Qy 301 

TGGCTCCAGGGCCCCAGAGATCTGAGGAGGGAAGCCCAGCTGGAGGCTCCTGTGGTCCTG 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5077 

TGGCTCCAGGGCCCCAGAGATCTGAGGAGGGAAGCCCAGCTGGAGGCTCCTGTGGTCCTG 5136 
Qy 361 

CCCTGGTCTGAGATCTTGGAGCCCTTCTTGAAGAGACGGTGTCCGCAGAGTTGCTGATCT 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5137 

CCCTGGTCTGAGATCTTGGAGCCCTTCTTGAAGAGACGGTGTCCGCAGAGTTGCTGATCT 5196 
Qy 421 

TCCTGCCCCTGGGGGCTACTCTTGCCCAGGGTTGGGCAAAGCAGAGTAGCTGGGAGTGTA 480 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5197 

TCCTGCCCCTGGGGGCTACTCTTGCCCAGGGTTGGGCAAAGCAGAGTAGCTGGGAGTGTA 5256 
Qy 481 

AGGAGAGGACCCTCGTCCCCTCACCAACCTCATCCTCTCTCCCCCTACCCACAGGTAGCC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5257 

AGGAGAGGACCCTCGTCCCCTCACCAACCTCATCCTCTCTCCCCCTACCCACAGGTAGCC 5316 
Qy 541 

TCATGGCTGCAACCTGTGAGATTAGCAACATTTTTAGCAACTACTTCAGTGCGATGTACA 600 



I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I! I I I I I I I I I I 
Db 5317 

TCATGGCTGCAACCTGTGAGATTAGCAACATTTTTAGCAACTACTTCAGTGCGATGTACA 5376 
Qy 601 

GCTCGGAGGACTCCACCCTGGCCTCTGTTCCCCCTGCTGCCACCTTTGGGGCCGATGACT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5377 

GCTCGGAGGACTCCACCCTGGCCTCTGTTCCCCCTGCTGCCACCTTTGGGGCCGATGACT 5436 
Qy 661 

TGGTACTGACCCTGAGCAACCCCCAGATGTCATTGGAGGGTACAGGTGGGTCTCAGCGGG 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5437 

TGGTACTGACCCTGAGCAACCCCCAGATGTCATTGGAGGGT ACAGGTGGGTCTCAGCGGG 5496 
Qy 721 

GTGGGATGGGGCACGGAGTGGGAGACAGATCCATCTAAGGGCCTGTTAGACAAATGGGGG 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54 97 

GTGGGATGGGGCACGGAGTGGGAGACAGATCCATCTAAGGGCCTGTTAGACAAATGGGGG 5556 
Qy 781 

AATAGGCAGGGAGGAGGGTCTCTAGGCAAATTCCAGGGCTAGAGGCTGAGACTTAGTGAC 84 0 

I I I I I I I I I I I I I I I I I I -I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5557 

AATAGGCAGGGAGGAGGGTCTCTAGGCAAATTCCAGGGCTAGAGGCTGAGACTTAGTGAC 5616 
Qy 841 

TGAGGTGCTGGGGGTTGTGGGGCTGTGACAGGCAGAGGGAGGTGTCAGATACCAGGACAA 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5617 

TGAGGTGCTGGGGGTTGTGGGGCTGTGACAGGCAGAGGGAGGTGTCAGATACCAGGACAA 5676 
Qy 901 

GGGTGTTGTGAATGCTACCTCCTGCCCCTACTCTTGGGATGGCTCCAAGGGCTGAGGTGT 9 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I' I 
Db 5677 

GGGTGTTGTGAATGCTACCTCCTGCCCCTACTCTTGGGATGGCTCCAAGGGCTGAGGTGT 5736 



Qy 961 

GAATCCCCAGTGTGCTCCAGGAATGGGGCTGTGTGGGCTGGGAGTGGTGGCTCACGCCTG 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I 
Db 5737 

GAATCCCCAGTGTGCTCCAGGAATGGGGCTGTGTGGGCTGGGAGTGGTGGCTCACGCCTG 57 96 
Qy 1021 

TAATCCCAGCACTTTGGGAGGCTGAGCTGAGCGGATCACCTGAGGTCAAGAGTTCGAGAC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 57 97 

TAATCCCAGCACTTTGGGAGGCTGAGCTGAGCGGATCACCTGAGGTCAAGAGTTCGAGAC 5856 
Qy 1081 

CAGCCTAGCCAACATGGTGAAACCCCGTCTCTACTAAAAATACAAAAAAAAATTTATCCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 5857 

CAGCCTAGCCAACATGGTGAAACCCCGTCTCT ACTAAAAATACAAAAAAAAATTTATCCC 5916 
Qy 1141 

AGCGTGGTGGTGGGCACCTATAATCCCAGCTACTGGGGAGGCTGACGCAGGAGTATCGCT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I' I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 5917 

AGCGTGGTGGTGGGCACCTATAATCCCAGCTACTGGGGAGGCTGACGCAGGAGTATCGCT 5976 
Qy 1201 

TGAACCTGGGAGGTGGAGGTTGCTGTGAGCCGAGATTGTGCCATTGCACCCCAGCCTAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5977 

TGAACCTGGGAGGTGGAGGTTGCTGTGAGCCGAGATTGTGCCATTGCACCCCAGCCTAGG 6036 
Qy 1261 

TGACAGGAGTGAGACTCCATCTCAAAAAAAAAAAAAAAAATGGGGCTGTAAGGTCTGCTG 1320 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6037 

TGACAGGAGTGAGACTCCATCTCAAAAAAAAAAAAAAAAATGGGGCTGTAAGGTCTGCTG 6096 
Qy 1321 

GGTGGCCTGAGCTGAGCCTGTTTCCCTGCCTGGCCCTTGCAGAGAAGGCCAGCTGGTTGG 1380 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 6097 

GGTGGCCTGAGCTGAGCCTGTTTCCCTGCCTGGCCCTTGCAGAGAAGGCCAGCTGGTTGG 6156 
Qy 1381 

GGGAACAGCCCCAGTTCTGGTCGAAGACGCAGGTTCTGGACTGGATCAGCTACCAAGTGG 14 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6157 

GGGAACAGCCCCAGTTCTGGTCGAAGACGCAGGTTCTGGACTGGATCAGCTACCAAGTGG 6216 
Qy 1441 

AGAAGAACAAGTACGACGCAAGCGCCATTGACTTCTCACGATGTGACATGGATGGCGCCA 1500 

I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 6217 

AGAAGAACAAGTACGACGCAAGCGCCATTGACTTCTCACGATGTGACATGGATGGCGCCA 6276 
Qy 1501 

CCCTCTGCAATTGTGCCCTTGAGGAGCTGCGTCTGGTCTTTGGGCCTCTGGGGGACCAAC 1560 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6277 

CCCTCTGCAATTGTGCCCTTGAGGAGCTGCGTCTGGTCTTTGGGCCTCTGGGGGACCAAC 6336 
Qy 1561 

TCCATGCCCAGCTGCGAGACCTCAGTGAGTCCAGGCCCCTGGAGGCTGGGGAGCAGCTCC 1620 

I I I I I I I I I I I I I I I I I I I J I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6337 

TCCATGCCCAGCTGCGAGACCTCAGTGAGTCCAGGCCCCTGGAGGCTGGGGAGCAGCTCC 6396 
Qy 1621 

ACATGTTGAGCTGAGTCGAGTTCAGTGTGGCCGTAGGCAGGCCCTGGAGCTCTGGGCCAG 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6397 

ACATGTTGAGCTGAGTCGAGTTCAGTGTGGCCGTAGGCAGGCCCTGGAGCTCTGGGCCAG 6456 
Qy 1681 

CTGCACAGCCAGAGAGAGCCCTTGAGGGAGGGATTAGGGGAGTGTGACCCTTCCTTCCTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 64 57 

CTGCACAGCCAGAGAGAGCCCTTGAGGGAGGGATTAGGGGAGTGTGACCCTTCCTTCCTT 6516 
Qy 1741 

CC ~ C'~C CC'-C C c — — C C" ~" c~ — C ~c 



CCTTGTCAGCTTCCAGCTCTTCTGATGAGCTCAGTTGGATCATTGAGCTGCTGGAGAAGG 1800 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6517 

CCTTGTCAGCTTCCAGCTCTTCTGATGAGCTCAGTTGGATCATTGAGCTGCTGGAGAAGG 6576 
Qy 1801 

ATGGCATGGCCTTCCAGGAGGCCCTAGACCCAGGGCCCTTTGGTGAGAACCCGTTTTCTC 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6577 

ATGGCATGGCCTTCCAGGAGGCCCTAGACCCAGGGCCCTTTGGTGAGAACCCGTTTTCTC 6636 
Qy 1861 

CTTCCTTCCCCAGCCTGTCTTGTCCCATCCCTGCCCCTCCACAGAGTGCTAGAGATGACC 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II "I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6637 

CTTCCTTCCCCAGCCTGTCTTGTCCCATCCCTGCCCCTCCACAGAGTGCTAGAGATGACC 6696 
Qy 1921 

CCCTCCCCAGACTTCTTCCTCCCTCAATTAGAAAAATTGCAGCAGGTCATCAGACCCATG 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 6697 

CCCTCCCCAGACTTCTTCCTCCCTCAATTAGAAAAATTGCAGCAGGTCATCAGACCCATG 6756 
Qy 1981 

GGCAGCATCACCTGTCCTGGTCTGGTCCCCTGAGCCCTCTCTGAGTTCTCACCTCCTCTT 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6757 

, GGCAGCATCACCTGTCCTGGTCTGGTCCCCTGAGCCCTCTCTGAGTTCTCACCTCCTCTT 6816 
Qy 2041 

CCCAGACCAGGGCAGCCCCTTTGCCCAGGAGCTGCTGGACGACGGTCAGCAAGCCAGCCC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6817 

CCCAGACCAGGGCAGCCCCTTTGCCCAGGAGCTGCTGGACGACGGTCAGCAAGCCAGCCC 687 6 
Qy 2101 

CTACCACCCCGGCAGCTGTGGCGCAGGAGCCCCCTCCCCTGGCAGCTCTGACGTCTCCAC 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6877 

C -CC~CCCC~~C~ ~C ~ ~~C~C CCCCC CCCC ~"C"~C C "C~ C CC~C 



CTACCACCCCGGCAGCTGTGGCGCAGGAGCCCCCTCCCCTGGCAGCTCTGACGTCTCCAC 6936 
Qy 2161 

CGCAGGTGAGAGCTCTCTCTGGGCCACAACCTCCCTTCCCCGAAGTGTCCCTTGTTCCCT 2220 

I I I I I I I I I II I II I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I II I I I II I I 
Db 6937 

CGCAGGTGAGAGCTCTCTCTGGGCCACAACCTCCCTTCCCCGAAGTGTCCCTTGTTCCCT 6996 
Qy 2221 

CTGGCTCCCAGCACCATAACTCAGGCCTTCTGGCAGGAACAGGAACAGGCTGGGAAGTGT 2280 

I I I I I I I I I I I I I I I I I I I I I I I I. I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6997 

CTGGCTCCCAGCACCATAACTCAGGCCTTCTGGCAGGAACAGGAACAGGCTGGGAAGTGT 7056 
Qy 2281 

GTCCTGAGAGCCAGCAGCGTGGTTGAACAGAAGGTGGGCCGGCAGGGGACTTACTCTGAC 2340 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7057 

GTCCTGAGAGCCAGCAGCGTGGTTGAACAGAAGGTGGGCCGGCAGGGGACTTACTCTGAC 7116 
Qy 2341 

CCCGCCCCCCAGGGACTGGTGCTTCTCGGAGCTCCCACTCCTCAGACTCCGGTGGAAGTG 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7117 

CCCGCCCCCCAGGGACTGGTGCTTCTCGGAGCTCCCACTCCTCAGACTCCGGTGGAAGTG 7176 
Qy 2401 

ACGTGGACCTGGATCCCACTGATGGCAAGCTCTTCCCCAGCGGTGAGTCGAGGGAGGTCC 2460 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7177 

ACGTGGACCTGGATCCCACTGATGGCAAGCTCTTCCCCAGCGGTGAGTCGAGGGAGGTCC 7236 
Qy 2461 

CCAAGAGGGCGTCCCATTTAGCAATGCACAGGGGGCCCGGCTCTTCCTGCAGCCTTTTCC 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7237 

CCAAGAGGGCGTCCCATTTAGCAATGCACAGGGGGCCCGGCTCTTCCTGCAGCCTTTTCC 7296 
Qy 2521 

TGTAGAGGGGCTACTCTCCCTAACTCCCCTCTTGCCCCTCCTTGACCTTCCACCACCGTC 2580 



1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 7297 

TGTAGAGGGGCTACTCTCCCTAACTCCCCTCTTGCCCCTCCTTGACCTTCCACCACCGTC 7356 
Qy 2581 

CCCACAGATGGTTTTCGTGACTGCAAGAAGGGGGATCCCAAGCACGGGAAGCGGAAACGA 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7357 

CCCACAGATGGTTTTCGTGACTGCAAGAAGGGGGATCCCAAGCACGGGAAGCGGAAACGA 7416 
Qy 2641 

GGCCGGCCCCGAAAGCTGAGCAAAGAGTACTGGGACTGTCTCGAGGGCAAGAAGAGCAAG 2700 

I I I I II I I I 1.1 I I I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7417 

GGCCGGCCCCGAAAGCTGAGCAAAGAGTACTGGGACTGTCTCGAGGGCAAGAAGAGCAAG 7476 
Qy 2701 

CACGGTGAGCTCCGGGGGCACGTGGGTCCTCCCTGCGCCGGGCTGAGCGGCTTCCTGGGG 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7477 

CACGGTGAGCTCCGGGGGCACGTGGGTCCTCCCTGCGCCGGGCTGAGCGGCTTCCTGGGG 7536 
Qy 2761 

CACTGCGGGTTGTTGCAGGTATCCCTTCTCCCGTTTTCTCTGGCCTCCGCATGGCCTTTG 2820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7537 

CACTGCGGGTTGTTGCAGGTATCCCTTCTCCCGTTTTCTCTGGCCTCCGCATGGCCTTTG 7596 
Qy 2821 

GTAAGGCTGTGCACAAGCTGGGGGCTCTATGGTATCGGTCACCACCTAATTGCAGAGCCT 2880 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7597 

GTAAGGCTGTGCACAAGCTGGGGGCTCTATGGTATCGGTCACCACCTAATTGCAGAGCCT 7656 
Qy 2881 

GGCTTGGTGGTCCTGGAGAGGAGGAGGAAATAAGGCTCCCAGTGGGAGGCTCATGGTACC 2940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 7657 

GGCTTGGTGGTCCTGGAGAGGAGGAGGAAATAAGGCTCCCAGTGGGAGGCTCATGGTACC 7716 



Qy 2941 

AGAGTCCTGTCCACTGACTCCAGTGTCCTGTCCACTGACTCCAGTTCTCTCTGCACTTGG 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7717 

AGAGTCCTGTCCACTGACTCCAGTGTCCTGTCCACTGACTCCAGTTCTCTCTGCACTTGG 777 6 
Qy 3001 

CCACTGTCCTGCCCTCTGGGACACCCTCAATGTGAGGAGGCAGCTGGTGGGTCTTAGGTG 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7777 

CCACTGTCCTGCCCTCTGGGACACCCTCAATGTGAGGAGGCAGCTGGTGGGTCTTAGGTG 7836 
Qy 3061 

GGCTGAGGAGAAAAGCAGTCACTGCAGTACCCGCACAGAGGGCACTGCGGGGTCTCTGGA 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7837 

GGCTGAGGAGAAAAGCAGTCACTGCAGTACCCGCACAGAGGGCACTGCGGGGTCTCTGGA 7 896 
Qy 3121 

GAGGCTTGCTGCATGCTGTGGCCAAGTCAGCAGTGCACTGGGGCGGGCAGGGCTGGCTGG 3180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 7897 

GAGGCTTGCTGCATGCTGTGGCCAAGTCAGCAGTGCACTGGGGCGGGCAGGGCTGGCTGG 7 956 
Qy 3181 

CCTTGGGTGAGAGGGGACACCTGGATGGCAAACTGATGGAGGCTGGCCTTGCAGCGCCCA 3240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 957 

CCTTGGGTGAGAGGGGACACCTGGATGGCAAACTGATGGAGGCTGGCCTTGCAGCGCCCA 8016 
Qy 3241 

GAGGCACCCACCTGTGGGAGTTCATCCGGGACATCCTCATCCACCCGGAGCTCAACGAGG 3300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8017 

GAGGCACCCACCTGTGGGAGTTCATCCGGGACATCCTCATCCACCCGGAGCTCAACGAGG 807 6 
Qy 3301 

GCCTCATGAAGTGGGAGAATCGGCATGAAGGCGTCTTCAAGTTCCTGCGCTCCGAGGCTG 3360 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 

Db 8077 

GCCTCATGAAGTGGGAGAATCGGCATGAAGGCGTCTTCAAGTTCCTGCGCTCCGAGGCTG 8136 
Qy 3361 

TGGCCCAACTATGGGGCCAAAAGAAAAAGAACAGCAACATGACCTACGAGAAGCTGAGCC 3420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8137 

TGGCCCAACTATGGGGCCAAAAGAAAAAGAACAGCAACATGACCTACGAGAAGCTGAGCC 8196 
Qy 3421 

GGGCCATGAGGTGAGCTGGCGGCCAGGACCCTCACGATACAGCCGGACATGGGGACAGGC 3480 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8197 

GGGCCATGAGGTGAGCTGGCGGCCAGGACCCTCACGATACAGCCGGACATGGGGACAGGC 8256 
Qy 3481 

GCTCACACTCCCACCGCCCTCTTTCTGGCTGCCACTTGGTTTCTTGCAACAGGGCTGAGT 3540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8257 

GCTCACACTCCCACCGCCCTCTTTCTGGCTGCCACTTGGTTTCTTGCAACAGGGCTGAGT 8316 
Qy 3541 

CCTTAGAGTGAGGACAACATCTGGGTTGGTCTACTTCATGGATTAAATGACAACATGGAG 3600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8317 

CCTTAGAGTGAGGACAACATCTGGGTTGGTCTACTTCATGGATTAAATGACAACATGGAG 8376 
Qy 3601 

AAAGTATTAGCCTGGCAGACAGCAGACACAGTGCACTTGAGCTAGCAGCAACATTTCTTG 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8377 

AAAGTATTAGCCTGGCAGACAGCAGACACAGTGCACTTGAGCTAGCAGCAACATTTCTTG 84 36 
Qy 3661 

TATCGCCTGTGAGGCTTGTCCTCAGGAAGGCACCTGGAGAGTGGGAAAGGGGGCAGGAGC 3720 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 84 37 

TATCGCCTGTGAGGCTTGTCCTCAGGAAGGCACCTGGAGAGTGGGAAAGGGGGCAGGAGC 84 96 



Qy 3721 

CGTGCCCACCCAGGGCCTGGCTTTCTCCTCGTTGAAGCACTTAGGTTGTTTTTCTCTGGG 3780 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 84 97 

CGTGCCCACCCAGGGCCTGGCTTTCTCCTCGTTGAAGCACTTAGGTTGTTTTTCTCTGGG 8556 
Qy 3781 

CCTCAGTTTCCTCCTGTGTCCAGGAGTACACTAGATCATCTTAAGATCCCGTCCAGCCCT 3840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 8557 

CCTCAGTTTCCTCCTGTGTCCAGGAGTACACTAGATCATCTTAAGATCCCGTCCAGCCCT 8616 
Qy 3841 

AAAATCATGTACTTACTTTTTTTTTCTTTTTCTTTTTTAAATAGAGGCAAGGGTCTCTAC 3900 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 8617 

AAAATCATGTACTTACTTTTTTTTTCTTTTTCTTTTTTAAATAGAGGCAAGGGTCTCTAC 8 67 6 
Qy 3901 

GTTGGCCAGGCCGGTCTCAAACTCCTGGCCTCAAATGACTCTCCTGCCTCGGCCTCTCAA 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8677 

GTTGGCCAGGCCGGTCTCAAACTCCTGGCCTCAAATGACTCTCCTGCCTCGGCCTCTCAA 8736 
Qy 3961 

AGTGCTGGGATTACAGGTGTGAGCCACCGTGCCCAGCTCCCTGGCCTTAAAAGTCATGTA 4020 

I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I 
Db 8737 

AGTGCTGGGATTACAGGTGTGAGCCACCGTGCCCAGCTCCCTGGCCTTAAAAGTCATGTA 87 96 
Qy 4021 

ATTTAATGATCAGACCCCAGTCACAGCCATAGGATACAAAGAAGCAAAGGCAAAGAGCCC 4 080 

. I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I 
Db 87 97 

ATTTAATGATCAGACCCCAGTCACAGCCATAGGATACAAAGAAGCAAAGGCAAAGAGCCC 8856 
Qy 4081 

TGTGTCCTGGGCACGGTTACAGGCCAGTGTAGGGAAAGAGCTTCTGCTTGCCAGTGTGAA 4140 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 8857 

TGTGTCCTGGGCACGGTTACAGGCCAGTGTAGGGAAAGAGCTTCTGCTTGCCAGTGTGAA 8 916 
Qy 4141 

GAACAGAGGAGTTTAGGAAGTGTGAGTCAGGCTCAGCTTAGTCAGGCAGAGACCAGTGGG 4200 

1 1 1 1 1 1 1 1 1 1 1 r 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i'i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 8917 

GAACAGAGGAGTTTAGGAAGTGTGAGTCAGGCTCAGCTTAGTCAGGCAGAGACCAGTGGG 8976 
Qy 4201 

CATGGGTTACCTGGGGGTAACGCGGGCCAGGTGGGCGGGCTGGCAGCCTGGGGCCCATTT 4260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 8977 

CATGGGTTACCTGGGGGTAACGCGGGCCAGGTGGGCGGGCTGGCAGCCTGGGGCCCATTT 9036 
Qy 4261 

CCTGCCAAAGCACCTCTGACCATCCTTCTCTTCACCCAGGTACTACTACAAACGGGAGAT 4 320 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 9037 

CCTGCCAAAGCACCTCTGACCATCCTTCTCTTCACCCAGGTACTACTACAAACGGGAGAT 9096 
Qy 4321 

CCTGGAACGGGTGGATGGCCGGCGACTCGTCTACAAGTTTGGCAAAAACTCAAGCGGCTG 4380 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 9097 

CCTGGAACGGGTGGATGGCCGGCGACTCGTCTACAAGTTTGGCAAAAACTCAAGCGGCTG 9156 
Qy 4381 

GAAGGAGGAAGAGGTTCTCCAGAGTCGGAACTGAGGGTTGGAACTATACCCGGGACCAAA 4440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 9157 

GAAGGAGGAAGAGGTTCTCCAGAGTCGGAACTGAGGGTTGGAACTATACCCGGGACCAAA 9216 
Qy 4441 

CTCACGGACCACTCGAGGCCTGCAAACCTTCCTGGGAGGACAGGGAGGCCAGATGGCCCC 4 500 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 9217 

CTCACGGACCACTCGAGGCCTGCAAACCTTCCTGGGAGGACAGGCAGGCCAGATGGCCCC 9276 
Qy 4501 

CC'C ~C ccc-c - ~C ~ C — ~ ~ C 



TCCACTGGGGAATGCTCCCAGCTGTGCTGTGGAGAGAAGCTGATGTTTTGGTGTATTGTC 4 560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I 
Db 9277 

TCCACTGGGGAATGCTCCCAGCTGTGCTGTGGAGAGAAGCTGATGTTTTGGTGTATTGTC 9336 
Qy 4561 

AGCCATCGTCCTGGGACTCGGAGACTATGGCCTCGCCTCCCCACCCTCCTCTTGGAATTA 4 620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 9337 

AGCCATCGTCCTGGGACTCGGAGACTATGGCCTCGCCTCCCCACCCTCCTCTTGGAATTA 9396 
Qy 4621 

CAAGCCCTGGGGTTTGAAGCTGACTTTATAGCTGCAAGTGTATCTCCTTTTATCTGGTGC 4 680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 9397 

CAAGCCCTGGGGTTTGAAGCTGACTTTATAGCTGCAAGTGTATCTCCTTTTATCTGGTGC 9456 
Qy 4681 

CTCCTCAAACCCAGTCTCAGACACTAAATGCAGACAACACCTTCCTCCTGCAGACACCTG 4740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 94 57 

CTCCTCAAACCCAGTCTCAGACACTAAATGCAGACAACACCTTCCTCCTGCAGACACCTG 9516 
Qy 4741 

GACTGAGCCAAGGAGGCCTGGGGAGGCCCTAGGGGAGCACCGTGATGGAGAGGACAGAGC 4 800 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 9517 

GACTGAGCCAAGGAGGCCTGGGGAGGCCCTAGGGGAGCACCGTGATGGAGAGGACAGAGC 9576 
Qy 4801 

AGGGGCTCCAGCACCTTCTTTCTGGACTGGCGTTCACCTCCCTGCTCAGTGCTTGGGCTC 4 860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 9577 

AGGGGCTCCAGCACCTTCTTTCTGGACTGGCGTTCACCTCCCTGCTCAGTGCTTGGGCTC 9636 
Qy 4861 

CACGGGCAGGGGTCAGAGCACTCCCTAATTTATGTGCTATATAAATATGTCAGATGTACA 4 920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 9637 

c"c — c c c~c ccc " - ~ ~c - c~~~ ~ ~C~ 



CACGGGCAGGGGTCAGAGCACTCCCTAATTTATGTGCTATATAAATATGTCAGATGTACA 9696 
Qy 4921 

TAGAGATCTATTTTTTCTAAAACATTCCCCTCCCCACTCCTCTCCCACAGAGTGCTGGAC 4980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I II I I I I I I I I I I I I I I 
Db 9697 

TAGAGATCTATTTTTTCTAAAACATTCCCCTCCCCACTCCTCTCCCACAGAGTGCTGGAC 9756 
Qy 4981 

TGTTCCAGGCCCTCCAGTGGGCTGATGCTGGGACCCTTAGGATGGGGCTCCCAGCTCCTT 5040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 9757 

TGTTCCAGGCCCTCCAGTGGGCTGATGCTGGGACCCTTAGGATGGGGCTCCCAGCTCCTT 9816 
Qy 5041 

TCTCCTGTGAATGGAGGCAGAGACCTCCAATAAAGTGCCTTCTGGGCTTTTTCTA 5095 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 9817 

TCTCCTGTGAATGGAGGCAGAGACCTCCAATAAAGTGCCTTCTGGGCTTTTTCTA 9871 



RESULT 2 
AL691482 

LOCUS AL691482 112539 bp DNA linear 

PRI 18-MAY-2005 

DEFINITION Human DNA sequence from clone RP11-510N19 on 
chromosome 1 Contains 

the ELF3 gene for E74-like factor 3 (ets domain 
transcription 

factor, epithelial-specific) , a novel gene, an LSM3 

homolog U6 

small nuclear RNA associated (S. cerevisiae) (LSM3) 
pseudogene, an 

ATPase H+ transporting lysosomal 9kDa V0 subunit e 

(ATP6V0E) 

pseudogene and a cysteine-rich protein 1 (intestinal) 

(CRIP1) 

pseudogene, complete sequence. 
ACCESSION AL691482 

VERSION • AL691482.16 GI:23503795 
KEYWORDS HTG; ATP6V0E; CRIP1; ELF3; LSM3 . 
SOURCE Homo sapiens (human) 

ORGANISM Homo sapiens 

~ C ' ' C ' • • ' 



GenCore version 6.2.1 
Copyright (c) 1993 - 2007 Biocceleration Ltd. 



OM nucleic - nucleic search, using sw model 

Run on: June 14, 2007, 04:31:56 ; Search time 854 Seconds 

(without alignments) 
10931.438 Million cell 

updates/sec 

Title: US-10-535-378-15^ 
Perfect score: 135 
Sequence: 1 

ctccgccactccggtaggat ccgagcaagagcgtagcctc 135 

Scoring table: IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 

Searched: 7568541 seqs, 34560148153 residues 

Total number of hits satisfying chosen parameters: 15137082 



Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 



Database : GenEmbl:* 



1 




gb_env : * 


2 




gb_pat : * 


3 




gb_ph : * 


4 




gb_pl : * 


5 




gb_pr : * 


6 




gb_ro : * 


7 




gb sts:* 


8 




gb_sy : * 


9 




gb_un : * 


10 


: gb vi : * 


11 


: gb_ov : * 


12 


: gb_htg : * 


13 


: gb_in : * 


14 


: gb_om : * 



AF110184 

LOCUS AF110184 10772 bp DNA linear 

PRI 22-JUL-1999 

DEFINITION Homo sapiens epithelium-restricted Ets protein ESX 
gene, complete 

cds . 

ACCESSION AF110184 

VERSION AF110184 .1 GI : 5565858 

KEYWORDS 

SOURCE Homo sapiens (human) 

ORGANISM Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; 
Euteleostomi; 

Mammalia; Eutheria; Euarchontoglires; Primates; 

Haplorrhini; 

Catarrhini; Hominidae; Homo. 
REFERENCE 1 (bases 4802 to 9870) 

AUTHORS Chang, C.H., Scott, G.K., Kuo,W.L., Xiong,X., 
Suzdaltseva, Y. , 

Park, J. W. , Sayre,P., Erny,K., Collins, C.,' Gray, J. W. 
and Benz,C.C. 

TITLE ESX: a structurally unique Ets overexpressed early 

during human 

breast tumor igenesis 
JOURNAL O ncogene 14 (13), 1617-1622 (1997) 
PUBMED 912 9154 ~ ~ ~ 

REFERENCE 2 (bases 1 to 10772) 

AUTHORS Chang, C.H., Scott, G.K., Baldwin, M. A. andBenz,C.C. 
TITLE Exon 4-encoded acidic domain in the 

epithelium-restricted Ets 

factor, ESX, confers potent transactivating capacity 

and binds to 

TATA-binding protein (TBP) 
JOURNAL Oncogene 18 (25), 3682-3695 (1999) 
PUBMED 10391676 
REFERENCE 3 (bases 1 to 10772) 

AUTHORS Chang, C.H., Scott, G.K. and Benz,G.C. 
TITLE Direct Submission 

JOURNAL Submitted ( 30-NOV-1998 ) Hematology/Oncology, U.C.S.F. 
505 

Parnassus Ave,, San Francisco, CA 94143-1270, USA 
FEATURES Location/Qualifiers 
source 1. .10772 

/organism="Homo sapiens" 
/mol_type="genomic DNA" 
/db xref="taxon: 9606" 



misc_f eature 
repeat_region 

repeat_region 

CAAT_signal 
additional 

TATA_signal 
additional 

mRNA 

.6360,6526. .6618, 
.8206,9076. .9872) 
ESX" 

5'UTR 
exon 

misc_f eature 

exon 

CDS 

.6618,6822. .6941, 

.9190) 

Homo 

Accession 
ESX" 



/chromosome=" 1 " 
/map="lq32" 
34. .622 

/note="similar to THC 213038" 

921. .1524 

/rpt_family="Alu" 

/rpt_type=dispersed 

2978. .3293 

/rpt_family="Alu" 

/rpt_type=dispersed 

4697. .4702 

/inf erence="non-experimental evidence, no 

details recorded" 
4735. .4736 

/inf erence="non-experimental evidence, no 
details recorded" 

join(4777. .4888,5311. .5481,6139. 

6822. .6941,7129. .7218,7364. .7480,8011. 

/product="epithelium-restricted Ets protein 

join(4777. .4888,5311. .5318) 
4777. .4888 
/number=l 
4785. .4901 

/note="putative CpG island" 

5311. .5481 

/number=2 

join(5319. .5481,6139. .6360,6526. 

7129. .7218,7364. .7480,8011. .8206,9076. 

/note="epithelial-restricted with serine box; 

sapiencs ESX cDNA ORF presented in GenBank 

Number U66894" 
/codon_start=l 

/product="epithelium-restricted Ets protein 

/protein_id="AAD45237 . 1" 
/db xref="GI:5565859" 



/translation="MAATCEISNIFSNYFSAMYSSEDSTLASVPPAATFGADDLVLTL 
SNPQMSLEGTEKASWLGEQPQFWSKTQVLDWISYQVEKNKYDASAIDFSRCDMDGATL 
CNCALEELRLVFGPLGDQLHAQLRDLTSSSSDELSWIIELLEKDGMAFQEALDPGPFD 
QGSPFAQELLDDGQQASPYHPGSCGAGAPSPGSSDVSTAGTGASRSSHSSDSGGSDVD 
LDPTDGKLFPSDGFRDCKKGDPKHGKRKRGRPRKLSKEYWDCLEGKKSKHAPRGTHLW 



EFIRDILIHPELNEGLMKWENRHEGVFKFLRSEAVAQLWGQKKKNSNMTYEKLSRAMR 



repeat_region 

exon 
exon 
exon 
exon 
exon 

misc_f eature 
exon 

repeat region 



exon 
3'UTR 

polyA_signal 



additional 



misc feature 



misc feature 



YYYKREILERVDGRRLVYKFGKNSSGWKEEEVLQSRN" 

5773. .6059 

/rpt_faraily="Alu" 

/rpt_type=dispersed 

6139. .6360 

/number=3 

6526. .6618 

/number=4 

6822. .6941 

/number=5 

7129. .7218 

/number=6 

7364. .7480 

/number=7 

7401. .7525 

/note="putative CpG island" 

8011. .8206 

/number=8 

8655. .8775 

/rpt_family="Alu" 

/rpt_type=dispersed 

9076. .9872 

/number=9 

9191. .9872 

9845. .9850 

/inf erence="non-experimental evidence, no 

details recorded" 
complement (9952. .10387) 
/note="similar to THC 209689" 
10358. .10772 

/note="similar to THC 203540" 



ORIGIN 



Query Match 



97.0%; Score 131; DB 5; Length 10772; 



Best Local Similarity 100.0%; Pred. No. 4.3e-34; 
Matches 131; Conservative 0; Mismatches 0; Indels 
0; Gaps 0; 

Qy 1 

CTCCGCCACTCCGGTAGGATTCCCCGCCTGTCATTCCCTAGCCCAGCTCTTGGGAAACTG 60 

I I I I II I I I I II I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 4876 

CTCCGCCACTCCGGTAGGATTCCCCGCCTGTCATTCCCTAGCCCAGCTCTTGGGAAACTG 4 935 
Qy 61 

CAGAGGGGTCCAGAGGATTTGCAGTTCTGAACCTGCACACTCCAGTCTAGGATCTCCGAG 120 

I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4936 

CAGAGGGGTCCAGAGGATTTGCAGTTCTGAACCTGCAC ACTCCAGTCTAGGATCTCCGAG 4 995 

Qy 121 CAAGAGCGTAG 131 

I I I I I I I I I I I 
Db 4996 CAAGAGCGTAG 5006 



RESULT 5 
AL691482 

LOCUS AL691482 112539 bp DNA linear 

PRI 18-MAY-2005 

DEFINITION Human DNA sequence from' clone RP11-510N19 on 
chromosome 1 Contains 

the ELF3 gene for E74-like factor 3 (ets domain 
transcription 

factor, epithelial-specific) , a novel gene, an LSM3 

homolog U6 

small nuclear RNA associated (S. cerevisiae) (LSM3) 
pseudogene, an 

ATPase H+ transporting lysosomal 9kDa V0 subunit e 

(ATP6V0E) 

pseudogene and a cysteine-rich protein 1 (intestinal) 

(CRIP1) 

pseudogene, complete sequence. 
ACCESSION AL691482 

VERSION AL691482.16 GI:23503795 

KEYWORDS HTG; ATP6V0E; CRIP1; ELF3; LSM3 . 
SOURCE Homo sapiens (human) 

ORGANISM Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; 



GenCore version 6.2.1 
Copyright, (c) 1993 - 2007 Biocceleration Ltd. 



OM nucleic - nucleic search, using sw model 

Run on: June 14, 2007, 04:31:56 ; Search time 3358 Seconds 

(without alignments) 
10931.438 Million cell 

updates/sec 

Title: US-10-535-378-11 
Perfect score: 531 
Sequence: 1 

ccgggctgagcggcttcctg acctgtgggagttcatccgg 531 

Scoring table: IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 

Searched: 7568541 seqs, 34560148153 residues 

Total number of hits satisfying chosen parameters: 15137082 



Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 



Database : GenEmbl:* 



1 




gb_env: * 


2 




gb_pat : * 


3 




gb_ph : * 


4 




gb pi : * 


5 




gb_pr : * 


6 




gb_ro : * 


7 




gb sts:* 


8 




gb_sy : * 


9 




gb_un : * 


10 


gb_vi : * 


11 


gb ov : * 


12 


: gb_htg:* 


13 


: gb in:* 


14 


gb_om : * 



Db 775 

AGGCAGCTGGTGGGTCTTAGGTGGGCTGAGGAGAAAAGCAGTCACTGCAGTACCCGCACA 834 



Qy 361 

GAGGGCACTGCGGGGTCTCTGGAGAGGCTTGCTGCATGCTGTGGCCAAGTCAAGCAGTGC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 835 

GAGGGCACTGCGGGGTCTCTGGAGAGGCTTGCTGCATGCTGTGGCCAAGTCAGCAGTGCA 8 94 
Qy 421 

ACTGGGGCGGCAGGGCTGGCTGGCCTTGGGTGAGAGGGGGCACCTGGATGGCAAACGGAT 480 



Db 895 

CTGGGGCGGGCAGGGCTGGCTGGCCTTGGGTGAGAGGGGACACCTGGATGGCAAACTGAT 954 

Qy 481 GGAGGCTGG-CTTGCAGCGCCCAGAGGCACCCACCTGTGGGAGTTCATCCGG 

531 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 955 GGAGGCTGGCCTTGCAGCGCCCAGAGGCACCCACCTGTGGGAGTTCATCCGG 

1006 



RESULT 2 
AF110184 

LOCUS AF110184 10772 bp DNA linear 

PRI 22-JUL-1999 

DEFINITION Homo sapiens epithelium-restricted Ets protein ESX 
gene, complete 
cds . 

ACCESSION AF110184 

VERSION AF110184.1 GI: 5565858 

KEYWORDS 

SOURCE Homo sapiens (human) 

ORGANISM Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; 
Euteleostomi; 

Mammalia; Eutheria; Euarchontoglires; Primates; 

Haplorrhini ; 

Catarrhini; Hominidae; Homo. 
REFERENCE 1 (bases 4802 to 9870) 

AUTHORS Chang, C.H., Scott, G.K., Kuo,W.L., Xiong,X., 
Suzdaltseva, Y. , 

Park, J. W . , Sayre,P., Erny,K., Collins, C, Gray, J. W. 
and Benz,C.C. 



TITLE ESX: a structurally unique Ets overexpressed early 

during human 

breast tumorigenesis 
JOURNAL Oncogene 14 (13) , 1 6 17- 1 622 (1997)__ 
PUBMED "9T29154 "~ 
REFERENCE 2 (bases 1 to 10772) 

AUTHORS Chang, C.H., Scott, G.K., Baldwin, M. A. and Benz,C.C. 
TITLE Exon 4-encoded acidic domain in the 

epithelium-restricted Ets 

factor, ESX, confers potent transactivating capacity 

and binds to 

TATA-binding protein (TBP) 
Oncogene 18 (25), 3682-3695 (1999)" 
10391676 

3 (bases 1 to 10772) 
Chang, C.H., Scott, G.K. and Benz,C.C. 
Direct Submission 

Submitted ( 30-NOV-l 998 ) Hematology/Oncology, U . C . S . F . , 



JOURNAL 
PUBMED 

REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

505 



FEATURES 

source 



misc_f eature 
repeat_region 

repeat_region 



CAAT_signal 
additional 

TATA_signal 
additional 

mRNA 

.6360,6526. .6618, 



Parnassus Ave., San Francisco, CA 94143-1270, USA 
Location/Qualifiers 
1. .10772 

/organism="Homo sapiens" 
/mol__type="genomic DNA" 
/db_xref="taxon: 9606" 
/chromosome=" 1 " 
/map="lq32" 
34. .622 

/note="similar to THC 213038" 
921. .1524 
/rpt_family="Alu" 
/rpt__type=dispersed 
2978. .3293 
/rpt_family="Alu" 
/rpt_type=dispersed 
4697. .4702 

/inf erence=" non-experimental evidence, no 



details recorded" 
4735. .4736 

/inf erence= "non-experimental evidence, no 
details recorded" 

join (4777. .4888, 5311. .54 81, 6139. 

6822. .6941,7129. .7218,7364. .7480,8011. 



.8206,9076. .9872) 
ESX" 

5'UTR 
exon 

misc_f eature 

exon 

CDS 

.6618,6822. .6941, 

.9190) 

Homo 

Accession 



ESX" 



/product="epithelium-restricted Ets protein 

join(4777. .4888,5311. .5318) 
4777. .4888 
/number=l 
4785. .4901 

/note="putative CpG island" 

5311. .5481 

/number=2 

join(5319. .5481,6139. .6360,6526. 

7129. .7218,7364. .7480,8011. .8206,9076. 

/note="epithelial-restricted with serine box; 

sapiencs ESX cDNA ORF presented in GenBank 

Number U66894" 
/codon_start=l 

/product="epithelium-restricted Ets protein 

/protein_id="AAD4 5237.1 " 
/db xref="GI: 5565859" 



/translation="MAATCEISNIFSNYFSAMYSSEDSTLASVPPAATFGADDLVLTL 
SNPQMSLEGTEKASWLGEQPQFWSKTQVLDWISYQVEKNKYDASAIDFSRCDMDGATL 
CNCALEELRLVFGPLGDQLHAQLRDLTSSSSDELSWIIELLEKDGMAFQEALDPGPFD 
QGSPFAQELLDDGQQASPYHPGSCGAGAPSPGSSDVSTAGTGASRSSHSSDSGGSDVD 
LDPTDGKLFPSDGFRDCKKGDPKHGKRKRGRPRKLSKEYWDCLEGKKSKHAPRGTHLW 

EFIRDILIHPELNEGLMKWENRHEGVFKFLRSEAVAQLWGQKKKNSNMTYEKLSRAMR 

YYYKREILERVDGRRLVYKFGKNSSGWKEEEVLQSRN" 
repeat_region 5773. .6059 

/rpt_family="Alu" 

/rpt_type=dispersed 
exon 6139. .6360 

/number=3 
exon 6526. .6618 

/number=4 
exon 6822. .6941 

/number=5 



exon 
exon 

misc_feature 
exon 

repeat_region 

exon 
3'UTR 

polyA_signal 



additional 



misc feature 



misc feature 



7129. .7218 
/number=6 
7364. .7480 
/number=7 
7401. .7525 

/note="putative CpG island" 

8011. .8206 

/number=8 

8655. .8775 

/rpt_family="Alu" 

/rpt_type=dispersed 

9076. .9872 

/number=9 

9191. .9872 

9845. .9850 

/inf erence="non-experimental evidence, no 

details recorded" 
complement (9952. .10387) 
/note="similar to THC 209689" 
10358. .10772 

/note="similar to THC 203540" 



ORIGIN 



Query Match 91.9%; Score 4 88; DB 5; Length 10772; 

Best Local Similarity 96.1%; Pred. No. 9.5e-139; 

Matches 511; Conservative 0; Mismatches 20; Ihdels 
1; Gaps 1; 

Qy 1 

CCGGGCTGAGCGGCTTCCTGGGGCACTGCGGGTTGTTGCAGGTATCCCCTCTCCCGTTTC 60 



Db 7514 

CCGGGCTGAGCGGCTTCCTGGGGCACTGCGGGTTGTTGCAGGTATCCCTTCTCCCGTTTT 757 3 

Qy 61 

CTCTGGCCTCCGCATGGCCTTTGGTAAGGCTGTGCACAAGCTGGGGGCTCTATGGTATCG 120 



Db 7574 

CTCTGGCCTCCGCATGGCCTTTGGTAAGGCTGTGCACAAGCTGGGGGCTCTATGGTATCG 7 633 



Qy 121 

GTCACCACCTAATTGCAGAGCCAGGCTTGGTGGTCCTGGAGAGGAGGAGGAAATAAGGCT 180 
I I I I I I I I I I I I I I I I I I I I I I 



Db 7 634 

GTCACCACCTAATTGCAGAGCCTGGCTTGGTGGTCCTGGAGAGGAGGAGGAAATAAGGCT 7 693 
Qy 181 

CCCAGTGGGAGGCTCATGGTACCAGAGTCCTGTCCACTGACTCCAGTGTCCTGTCCACTG 24 0 



Db 7694 

CCCAGTGGGAGGCTCATGGTACCAGAGTCCTGTCCACTGACTCCAGTGTCCTGTCCACTG 7753 
Qy 241 

ACTCCAGTTCTCTCTGCACTTGGCCACTGTCCTGCCCTCTGGGTCACCCTCAATGTGAGG 300' 



Db 7754 

ACTCCAGTTCTCTCTGCACTTGGCCACTGTCCTGCCCTCTGGGACACCCTCAATGTGAGG 7813 
Qy 301 

AGGCGGCTGGTGGGTCTTAGGTGGGCTGAGGAGAAAAGCAGTCACTGCAGTACCCGCACA 360 



Db 7814 

AGGCAGCTGGTGGGTCTTAGGTGGGCTGAGGAGAAAAGCAGTCACTGCAGTACCCGCACA 7 873 
Qy 361 

GAGGGCACTGCGGGGTCTCTGGAGAGGCTTGCTGCATGCTGTGGCCAAGTCAAGCAGTGC 420 

I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7874 

GAGGGCACTGCGGGGTCTCTGGAGAGGCTTGCTGCATGCTGTGGCCAAGTCAGCAGTGCA 7933 
Qy 421 

ACTGGGGCGGCAGGGCTGGCTGGCCTTGGGTGAGAGGGGGCACCTGGATGGCAAACGGAT 4 80 



Db 7934 

CTGGGGCGGGCAGGGCTGGCTGGCCTTGGGTGAGAGGGGACACCTGGATGGCAAACTGAT 7 993 

Qy 4 81 GGAGGCTGG-CTTGCAGCGCCCAGAGGCACCCACCTGTGGGAGTTCATCCGG 

531 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 7 994 GGAGGCTGGCCTTGCAGCGCCCAGAGGCACCCACCTGTGGGAGTTCATCCGG 

8045 



